近期,360創始人周鴻祎對互聯網圈進行了評論:在ChatGPT領域,美國超過了我們,中國公司和科研人員需要加速追趕。
ChatGPT的興起引起了國內外互聯網公司的關注。為了應對ChatGPT的挑戰,谷歌在2月8日緊急推出了人工智能聊天機器人Bard。國內的百度宣布將于3月初推出“文心一言”,其他互聯網公司也紛紛效仿。
截至2月10日,已經宣布擁有類似ChatGPT技術儲備、準備發布和已經發布類ChatGPT產品服務的國內大廠包括:阿里巴巴、騰訊、華為、字節跳動、京東、360、科大訊飛、快手、網易有道等,超過10家互聯網巨頭紛紛進入了熱門的ChatGPT領域。
小型科技公司正在跟風熱度,大型公司也并非輕松控制ChatGPT。比如谷歌Bard發布時,演示視頻中犯了一個事實錯誤,導致谷歌股價大跌,目前市值已經下降了1700億美元。
1.扎堆入局ChatGPT競賽
在搜索和AI領域積累最深的百度,自然被市場寄予厚望。
百度,作為在搜索和AI領域積累最深的公司,在市場上擁有很高的期望。計劃在今年三月推出一款類似于ChatGPT的人工智能聊天機器人服務,名為“文心一言”,英文名為ERNIE Bot。在內測完成后,將向公眾開放。不同的是,該工具將初始版本內嵌入搜索服務中,允許用戶通過對話式方式獲得搜索結果。
百度的CEO李彥宏在去年9月判斷人工智能的發展將有“技術層面和商業應用層面的方向性改變”。盡管沒有首先推出ChatGPT,但百度具備了人工智能所需的算力、算法和數據,在芯片、框架、模型和應用四個技術方面都有布局,是國內少數擁有全棧AI能力的公司。
相比百度的技術研發儲備,阿里和字節跳動可能是另外兩個較早布局的玩家。
2月9日,阿里的達摩院版ChatGPT在內測中預先曝光。該新產品具備多種功能,包括知識問答、人工智能繪畫、代碼生成、小說續寫、文案撰寫和寫詩作詞等。在人工問答的水平方面,達摩院版ChatGPT已經實現了相對真實的回答,同時也能實現多輪問答。
實際上,在2022年5月,阿里公布了相應的能力,在AIGC方面,隨著超大規模多模態預訓練模型M6的發布,生成的實景圖片已經非常逼真。
阿里現已推出了M6芯片,支持十萬億的模型參數規模,平均單卡可承載200億參數,同等參數規模能耗僅為前業界標桿的1%,大大降低了大模型訓練的門檻。
字節動態正在研發ChatGPT,雖然全棧技術不是非常出色,但在商業應用方面有很大的前瞻性。字節動態從去年開始研發類ChatGPT項目,現在已經在內部上線了測試插件,由AI實驗室主導,還在探索當中。此外,字節動態的AML團隊也開發了veGiantModel模型,類似于為ChatGPT提供支持的GPT-3.5系列模型。
字節動態早就著手研究基于GPT2和GPT3的訓練模型和產品,在NLP領域也有許多研究積累。目前,字節動態在對話機器人、機器翻譯、機器寫作方面有多項研究,特別是內容創作方面。在ChatGPT用于寫文章之前,字節動態就研發了Xiaomingbot自動寫稿平臺,從2016年上線以來,已經寫了60萬篇文章,覆蓋了17場體育賽事,支持6種語言。
近日,快手也宣布正在大力研究大型語言模型(LLM),并已經啟動了相關項目,涵蓋了LLM模型的訓練、文字自動創作和生成、對話系統的開發等領域。
另外,京東云的言犀也宣布將推出工業版的ChatGPT:ChatJD,其參數量預計為千億級別,主要應用于零售和金融兩個領域。
2.國內大廠為何沒能搶得先機?
近幾年,大量的大公司和研究機構加入了人工智能領域,但真正有實力的玩家并不多。估測訓練1750億參數的GPT-3語言模型需要上萬個CPU/GPU,持續輸入數據24小時,而且一次運算就需要450萬美元,能耗相當于開車往返地球和月球。因此,主流的大型語言模型只能被大型科技公司和少數研究機構掌握。
從參數數量上看,國內百度的文心模型有2600億參數,高于GPT-3的1700億參數,但參數數量不能代表模型的效果。國內公司如百度和字節跳動擁有大量數據積累,但數據清洗、標注、模型設計、訓練和推理等需要時間積累,這可能是國內模型效果不如國外的重要原因。
關鍵時間點是2020年年中,GPT3.0剛剛推出。據流傳的專家紀要,很多人認為GPT3.0不僅代表了技術,也是人工智能模型發展的新理念,因為開發商OpenAI對此具有獨到的見解,領先于國外的Google,國內公司比OpenAI晚了兩年。
許多科技企業認為,ChatGPT并不是一種革命性的技術。它是OpenAI對GPT-3模型進行微調后開發出的對話機器人,并未實現底層模型的重大突破,只是通過理解、生成和交些相結合的方式,基于人類反饋進行強化訓練,從而帶給人們智能的體驗感。
Meta首席人工智能科學家Yann LeCun也曾表達過對ChatGPT的看法,他認為它并沒有什么特別的創新,許多研究實驗室都在使用同樣的技術。
很多互聯網企業沒有意識到ChatGPT對現有搜索模式的顛覆,也沒有準確預測到ChatGPT對腦力勞動者產生替代的關系。他們認為“聊天”只是一種淺層的應用,僅僅是一個更強的聊天機器人,現階段并不能看到其商業的潛力。
同樣的觀點還包括字節的NPL算法工程師,他認為ChatGPT是一個不確定性極高的項目,國內尚未有成功的先例。如果決定全力以赴,很難獲得資源支持,更別說提高優先級了。因為國內的技術能力有限,缺少人力、資金和基礎模型,對于互聯網大廠這種商業公司而言,有著較大的難度。
造成的結果表現在不僅認知層面存在局限,在技術上也有所局限。ChatGPT 的信息截至 2021 年,這意味著它無法提供實時信息。現在,百度正在努力解決信息實時性問題。與此同時,ChatGPT 已經在準備推出基于 GPT-4 的新產品,國內企業也有了新的目標需要實現。
3.跟風熱潮中,誰在硬蹭熱點?
前阿里云大模型負責人楊紅霞評論了目前互聯網公司熱衷于做ChatGPT的現狀。她表示:“僅有參數規模達到100B以上的大模型才有足夠的實力來提供高質量的對話回答。”
根據這個標準,百度的飛槳平臺和文心大模型、阿里的“通義”大模型以及華為的鵬城盤古大模型都有較高的實力。而360、網易有道以及學而思等企業目前技術研發水平和進度較差,缺乏相應的大模型和技術儲備。
此外,還有一些企業被認為是跟隨潮流追風口,比如漢王科技。根據半年報,該公司相關的文本大數據業務營收僅占總營收的14%,同比還有下降趨勢。然而,該公司卻通過炒作ChatGPT概念實現了股價的暴漲。
近期,越來越多的企業都在積極使用ChatGPT技術來提升自身業務。然而,也有一些企業并沒有采取任何行動,但卻受益于ChatGPT熱潮。2月8日,微軟推出了集成了ChatGPT技術的新版必應,其回答內容中不少答案來自知乎,該天下午知乎的股價一度漲幅超過56%。由于ChatGPT可能對社區問答造成深遠影響,知乎方面一直對ChatGPT相關事宜保持沉默。但市場對其仍然熱愛,帶動了股價的增長。
有業內人士表示,許多中小型企業缺乏技術實力,但也可以利用開源的Transformer大模型,在一定程度上實現ChatGPT的功能。
然而,達摩院專家表示,目前大規模預訓練的基于Transformer的模型雖然能很好地解決感知智能相關任務,但由于缺乏精心設計的純Transformer模型,基本無法實現認知智能。
正如字節跳動的情況,火山引擎的售前支持人員也表示,該平臺尚未推出類似產品,但可以通過機器學習平臺與自家產品結合,經過二次開發,能夠實現類ChatGPT的效果。
4.尾聲
AIGC尤其是目前的ChatGPT確實是非常重要的新方向,不像之前談元宇宙很多人不認可、談28nm落地很多人搖頭、談國產操作系統大家尷尬一笑,經過這段時間發酵,和AI相關的上下游企業都是非常緊張而且重視的態度。
AI產業的成熟,是大家目前極少數能看清的,可以提升整個社會生產效率的可落地工具,也就是很多年不再提升的全要素生產率,能再上一個臺階的最大希望(很多人原本期待L4自動駕駛會先落地),經濟增長越慢大家才越內卷,AI有可能會讓經濟增速上一個臺階。這個方向是幾乎不可能被放棄的,對于互聯網頭部企業而言,如果這一次的機遇無法把握住,那么像新巨頭字節之前用算法(當時的最新工具)顛覆老巨頭百度這種事情也會有很大概率再次上演,這也是各家非常緊張的真實原因。
但是實際來看,也能理解這里算法、算力、數據三個方面的要求都是極高的,所以嚴格意義上只有巨頭能做。從事實出發,我們不能發現,現在連足夠算力的先進制程AI芯片都不夠,目前大家能想到的妥協方案是用CPU來頂。所以小公司撐不起全譜系AI研發,大概率仍舊是接入端口部署應用,包括最后國內能活下來的AI平臺,可能也就是兩至三家;
如果類比AI產業對于,就如8年前伊始的新能源汽車,有兩三年的技術代差,但是核心技術沒有實質性壟斷、沒有專利權鐵桶、沒有制造業上的硬門檻,目前對于國內最尷尬的是算力芯片的困局,但是在其他領域(數據源、人工標注、中文語境)是有比較優勢的,有點像當年新能源車里我們有(國內市場、人工、電池、補貼)這些優勢一樣。希望是靠著補貼、市場容量、制造業優勢(這次是數據源優勢),能彎道超車,起碼不落后。
包括騰訊、阿里、字節、小紅書、菜鳥等互聯網公司,已經在NPL算法工程師等相關招聘崗位中,加入了從業者需了解熟悉GPT-3等相關模型的要求。而招聘的月薪多在4萬元左右,最高可達10萬元。
2023年,ChatGPT點燃的這把火,可以淬煉出真金的企業和人才,也可以蒸發掉虛妄的概念。最后想說的是,ChatGPT是開胃菜,GPT4.0才是大餐。